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基于 ResNet 网 络 的 花卉 种 类 识别 研究 
摘 要 


近年 来 ， 随 着 深度 学 习 技术 的 迅速 发 展 ， 基 于 卷 积 神经 网 络 〈CNN) 
的 图 像 识别 在 各 个 领域 取得 了 显 赣 的 成 就 。 在 植物 学 领域 ， 花 天 种 类 的 识 
别 是 一 个 重要 的 研究 方 同 , 对 于 生态 学 、 农 业 以 及 环境 监测 等 诸多 方面 具 
有 重要 意义 。 本 研究 旨 在 探索 并 优化 ResNet (深度 残 差 网 络 ) 在 花 开 种 
类 识别 任务 中 的 应 用 。 首先, 文章 对 ResNet 网 络 的 结构 进行 了 深入 分 析 ， 
理解 了 其 引入 残 送 学 习 的 机 制 , 以 及 如 何 有 效 地 应 对 深层 网 络 训练 中 的 梯 
度 消失 和 焊 炸 问题 。 通 过 在 花 开 图 像 数 据 集 上 的 实验 ， 验 证 了 ResNet 在 
处 理 复 杂 多 类 别 花 开 图 像 识 别 任务 上 的 卓越 性 能 。 在 数据 预 处 理 阶 段 , 文 
章 采 用 了 数据 增强 技术 ,包括 裁 勇 和 翻转 等 ， 以 扩充 训练 数据 集 ， 提 高 模 
型 的 泛 化 能 力 ， 同 时 对 花卉 图像 进行 了 标准 化 处 理 ， 以 适应 ResNet 网 络 
对 输入 数据 的 要 求 。 实 验 结果 表明 ， 相 较 于 传统 的 神经 网 络 模型 ， 采 用 
ResNet 网 络 的 花 开 种 类 识别 模型 在 准确 率 和 收敛 速度 上 均 有 显著 提升 。 
此 外 ， 通 过 深度 分 析 模 型 在 不 同 花 开 类 别 上 的 表现 ， 发 现 ResNet 网 络 在 
处 理 具有 层次 结构 和 复杂 形态 的 花 开 图 像 时 表现 更 为 出 色 。 本 文 提 出 的 模 
型 不 仅 在 整体 上 取得 了 优异 的 性 能 , 还 在 对 特定 花 弄 类 别 的 识别 上 具备 较 
高 的 准确 性 。 在 进一步 的 研究 中 , 我 们 考虑 通过 迁移 学 习 进 一 步 提升 模型 
的 泛 化 能 力 , 特别 是 在 面 对 小 样本 花卉 数据 集 时 。 同 时 将 探索 模型 的 实时 
性 能 ， 以 适应 现实 场景 中 对 花 开 种 类 快速 准确 识别 的 需求 。 

本 研究 通过 对 ResNet 网 络 在 花 开 种 类 识别 任务 中 的 优势 和 应 用 进行 
全 面 而 深入 的 分 析 , 为 深度 学 习 在 植物 学 领域 的 应 用 提供 了 有 益 的 参考 和 
借鉴 。 研 完成 果 不 仅 对 花 开 识别 技术 的 改进 具有 一 定 的 理论 价值 ,同时 也 
在 实际 应 用 中 具备 广泛 的 推广 潜力 。 
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RESEARCH ON RESERVATION TYPE 
IDENTIFICATION BASED ON RESNET NETWORK 


ABSTRACT 


In recent years, with the rapid development of deep learning 
technology, image recognition based on convolutional neural networks (CNN) 
has achieved remarkable achievements in various fields. In the field of botany, 
flower species identification is an important research direction and is of great 
significance in ecology, agriculture, and environmental monitoring. This 
research aims to explore and optimize the application of ResNet (deep residual 
network) in flower type recognition tasks. First, the article conducts an 
in-depth analysis of the structure of the ResNet network, understands its 
mechanism for introducing residual learning, and how to effectively deal with 
the vanishing and exploding gradient problems in deep network training. 
Through preliminary experiments on a large-scale flower image data set, the 
excellent performance of ResNet in handling complex multi-category flower 
image recognition tasks was verified. In the data preprocessing stage, the 
article uses data enhancement techniques, including cropping and flipping, to 
expand the training data set and improve the generalization ability of the 
model. At the same time, the flower images are standardized to adapt to the 
requirements of the ResNet network for input data. Experimental results show 
that compared with the traditional CNN model, the flower type recognition 
model using ResNet has significantly improved accuracy and convergence 
speed. In addition, through in-depth analysis of the model's performance on 
different flower categories, it was found that the ResNet network performed 
better when processing flower images with hierarchical structures and 
complex shapes. The model proposed in this article not only achieves 


excellent performance overall, but also has high accuracy in identifying 
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specific flower categories. In further research, we consider further improving 
the generalization ability of the model through transfer learning, especially 
when facing small sample flower data sets. At the same time, the real-time 
performance of the model will be explored to adapt to the need for rapid and 


accurate identification of flower types in real scenes. 


This study provides a useful reference and reference for the 
application of deep learning in the field of botany by conducting a 
comprehensive and in-depth analysis of the advantages and applications of 
ResNet network in flower species recognition tasks. The research results not 
only have certain theoretical value for the improvement of flower 
identification technology, but also have extensive potential for promotion in 


practical applications. 


KEY WORDS: Flower Recognition, Resnet Network, Transfer Learning 
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前 A 


随 着 社会 的 进步 和 生活 质量 的 提高 ， 人 们 对 花 齐 的 的 关注 逐渐 升温 ， 
花 弄 种 类 的 识别 对 于 植物 学 家 、 园 世 师 以 及 环境 保护 者 具有 重要 价值 。 然 
而 ， 由 于 花卉 种 类 繁多 、 形 态 各 异 ， 传统 的 人 工 识别 方法 在 效率 和 准确 性 
上 面临 挑战 。 而 随 着 深度 学 习 技 术 的 崛起 ， 基 于 卷 积 神经 网 络 (CNN) 的 
图 像 识 别 在 多 个 领域 取得 了 显著 的 成 功 。 虽 然 卷 积 神经 网 络 在 图 像 识别 中 
表现 出 色 , 但 是 在 处 理 深层 网 络 中 存在 的 梯度 消失 和 梯度 爆炸 问题 时 , 传 
统 的 网 络 结构 逐渐 显得 力不从心 。ResNet (Residual Network) 由 其 引入 
的 残 差 学 习 框架 而 在 ImageNet 竞赛 中 大 放 异 彩 ， 其 独特 的 残 差 块 设 计 有 
效 地 缓解 了 梯度 问题 ， 使 得 网 络 更 深 时 反而 更 容易 训练 。 因 此 , 将 ResNet 
应 用 于 花卉 种 类 识别 ， 有 望 提高 识别 准确 性 并 加 速 训 练 过 程 ”。 

本 研究 的 主要 目的 在 于 探索 基于 ResNet 网 络 的 花 开 种 类 识别 方法 ， 
通过 深度 学 习 技术 提高 花 开 图 像 的 自动 化 分 类 准确 性 。 通 过 借鉴 ResNet 
网 络 的 残 差 学 习 机 制 ， 本 研究 绅 在 建立 一 个 稳健 、 高 效 的 花卉 识别 模型 ， 
为 植物 学 研究 、 生 态 监测 和 园艺 设计 等 领域 提供 有 力 的 支持 。 本 研究 将 主 
要 关注 以 下 思 个 方面 : 

花 开 数据 集 的 构建 : 采用 大 规模 、 多 样 性 的 花 开 图 像 数 据 集 ， 以 确保 
模型 具有 民 好 的 泛 化 能 

ResNet 网 络 的 深入 研究 : 通过 对 ResNet 网 络 结构 的 详细 分 析 ， 深 入 
理解 其 残 差 学 习 机 制 ， 并 针对 花卉 种 类 识别 任务 进行 优化 。 

模型 训练 与 优化 :利用 构建 的 花 齐 数据 集 对 ResNet 网 络 进行 训练 ， 
并 通过 调整 超 参数 、 采 用 迁移 学 习 等 方法 对 模型 进行 优化 ， 以 提高 识别 准 
确 性 。 

通过 本 研究 , 预期 将 为 花卉 种 类 识别 领域 的 深度 学 习 应 用 提供 新 的 思 
路 和 方法 。 同时， 本 研究 还 有 望 为 其 他 图 像 识 别 任 务 提供 借鉴 和 参考 ， 推 
动 深度 学 习 在 植物 学 、 农 业 和 环境 科学 等 领域 的 应 用 。 
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第 1 章 绪论 


1.1.1 研究 背景 

花卉 种 类 识别 作为 计算 机 视觉 领域 中 的 一 个 重要 任务 ， 近 年 来 受益 于 深度 学 习 技 
术 的 发 展 ， 取 得 了 显著 的 进展 。 花 卉 识别 在 农业 、 生 态 学 、 园 艺 学 等 领域 有 着 广泛 的 
应 用 ， 例 如 在 植物 学 研究 、 城 市 绿化 规划 和 花卉 市 场 管理 等 方面 发 挥 着 关键 作用 。 然 
而 ， 由 于 花卉 的 种 类 繁多 、 形 态 各 异 ， 传 统 的 图 像 识别 方法 在 解决 这 一 问题 上 显得 力 
不 从 心 , 而 深度 学 习 技术 的 兴起 为 图 像 识别 领域 带 来 了 新 的 机 遇 。 卷 积 神经 网 络 (CNN) 
作为 深度 学 习 的 代表 , 成 功 地 解决 了 传统 方法 中 需要 手工 设计 特征 的 问题 ， 而 ResNet 
网 络 作为 一 种 深度 残 差 网 络 ， 在 解决 深度 网 络 训练 中 的 梯度 问题 上 具有 独特 的 优势 。 
因此 ， 将 ResNet 网 络 应 用 于 花 弄 种 类 识别 ， 成 为 提高 模型 性 能 和 泛 化 能 力 的 一 个 有 
前 景 的 方向 。 传 统 的 花卉 种 类 识别 方法 通常 依赖 于 手动 设计 的 特征 提取 器 ， 这 些 特征 
提取 器 对 花 开 图 像 中 的 复杂 纹理 、 颜 色 和 形状 往往 缺乏 有 效 的 刻画 。 因 此 ， 在 面 对 大 
规模 、 高 维度 的 花卉 图 像 数据 时 ， 传 统 方法 的 性 能 容易 受到 限制 。 此 外 ， 传 统 方法 通 
常 需要 大 量 的 领域 专业 知识 和 经 验 ， 限 制 了 其 在 实际 应 用 中 的 普 适 性 叫 。 

深度 学 习 的 兴起 为 花 开 种 类 识别 带 来 了 新 的 希望 ， 深 度 学 习 模 型 能 够 通过 端 到 端 
的 学 习 , 自动 地 从 大 量 的 数据 中 学 习 到 高 层次 的 抽象 特征 , 无 需 手动 设计 特征 提取 器 。 
这 种 自动 学 习 的 特性 使 得 深度 学 习 模 型 在 处 理 复杂 多 变 的 花卉 图 像 时 表现 更 为 出 色 。 
1.1.2 研究 意义 

深度 学 习 模型 ， 特 别 是 ResNet 网 络 ， 能 够 自动 学 习 图 像 中 的 抽象 特征 ， 从 而 提 
高 花卉 种 类 识别 的 准确 性 。 花 地图 像 可 能 具有 复杂 的 背景 、 多 样 的 角度 和 光照 条 件 ， 
ResNet 网 络 引 入 的 残 差 学 习 机 制 有 助 于 处 理 这 些 复杂 场景 , 提高 模型 的 鲁 棒 性 。 深度 
残 差 网 络 的 设计 有 效 解决 了 深层 网 络 训 练 中 的 梯度 消失 和 爆炸 问题 ,使 得 模型 更 易于 
训练 ， 收 敛 速度 更 快 ， 从 而 提高 了 训练 效率 。 花 弄 种 类 识别 技术 的 提升 将 有 助 于 加 深 
对 植物 分 类 学 和 植物 生态 学 的 认识 ， 推 动 相 关 领 域 的 研究 进展 。 花 卉 种 类 识别 技术 在 
农业 和 园艺 中 有 广泛 的 应 用 ， 通 过 精准 地 识别 花卉 种 类 ， 可 以 帮助 农民 和 园艺 爱好 者 
更 好 地 管理 植物 ， 提 高 生产 效率 和 观赏 价值 。 

然而 ， 要 在 花卉 种 类 识别 任务 中 取得 良好 的 性 能 ， 仍 然 面临 一 系列 挑战 。 例 如 ， 
花 开 图 像 存在 光照 、 角 度 、 尺 度 等 多 样 性 ， 模 型 需要 具备 较 强 的 鲁 棒 性 。 同 时 ， 花 卉 
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种 类 的 多 样 性 和 数量 庞大 也 对 模型 的 泛 化 能 力 提 出 了 更 高 的 要 求 。 通 过 研究 这 些 挑战 ， 
我 们 有 望 更 好 地 理解 深度 学 习 在 花卉 种 类 识别 中 的 应 用 ， 为 未 来 研究 提供 更 为 准确 和 
有 效 的 方向 。 

总 体 而 言 ， 基 于 ResNet 网 络 的 花 齐 种 类 识别 研究 不 仅 在 学 术 上 具有 重要 的 理论 
价值 ， 也 在 实际 应 用 中 有 着 广泛 的 实用 前 景 ， 对 于 推动 植物 学 和 计算 机 视觉 领域 的 交 
叉 研究 有 具有 积极 的 推动 作用 。 

1.2 国内 外 研究 现状 


传统 机 器 学 习 方 法 的 主要 研究 内 容 如 下 : Nilsback 最 早 提出 的 花卉 图 像 分 割 算 法 ， 
用 来 分 离 前 景 和 背景 。 之 后 Chai 等 人 在 Nilsback 等 的 基础 上 进行 改进 ， 提 出 了 一 种 
联合 过 滤 分 割 算法 BiCoS，Angelova 等 人 改进 了 之 前 的 算法 ， 他 们 先 检测 图 像 的 
low-level 位 置 ， 接 着 用 Propagation 算法 对 原始 的 花卉 图 像 进行 全 分 割 。 而 近年 来 ， 
随 着 深度 学 习 技术 的 发 展 ， 各 种 卷 积 神经 网 络 都 得 到 了 极 大 的 提升 以 及 扩展 ， 在 卷 积 
神经 网 络 CNN 为 基础 的 深度 学 习 方 法 中 , 以 GoogLeNet, ResNet. Batch Normalization 
等 网 络 模型 为 代表 ， 并 且 取 得 了 极 大 地 进展 。 有 学 者 采用 AlexNet 以 及 VGG 等 网 络 
模型 ， 用 数据 集训 练 好 网 络 参 数 初始 化 网 络 层 (最 后 一 层 全 连接 层 除外 )， 以 较 大 的 
学 习 速 率 训 练 最 后 一 层 全 连接 层 ， 以 较 小 的 学 习 速 率 微 调 瓶 人 颈 层 ，Hu 等 人 采用 
GoogLeNet， 先 在 数据 集 上 训练 网 络 ， 之 后 替换 掉 最 后 一 层 全 连接 层 ， 再 在 数据 集 上 
微调 网 络 ，Wu 等 人 采用 ResNet50， 先 在 数据 集 上 进行 网 络 的 训练 ， 之 后 以 一 个 较 小 
的 学 习 速 率 再 对 所 有 网 络 层 进行 微调 趾 。 

在 国外 ， 花 卉 种 类 识别 领域 已 经 取得 了 显著 的 研究 进展 。 研 究 者 们 普 换 采用 深度 
学 习 模 型 ， 特 别 是 ResNet 网 络 ， 来 提高 花 开 识别 的 准确 性 和 泛 化 能 力 。 许 多 研究 关 
注 如 何 通过 深度 学 习 网 络 ， 尤 其 是 ResNet， 在 大 规模 花卉 数据 集 上 进行 训练 ， 以 实现 
对 数 万 种 花卉 的 高 效 识 别 。 这 些 研究 通常 包括 对 网 络 结构 的 调整 和 数据 增强 策略 的 优 
化 。 部 分 研究 致力 于 解决 小 样本 花 开 数据 集 的 问题 ， 采 用 迁移 学 习 和 微调 等 技术 ， 使 
得 模型 更 好 地 适应 具有 限 样本 的 特定 花卉 识别 任务 。 

在 国内 ， 花 卉 种 类 识别 的 研究 也 逐渐 兴起 ， 研 究 者 们 开始 关注 如 何 利用 深度 学 习 
技术 提高 花卉 识别 的 精度 。 一 些 国内 研究 聚焦 于 优化 ResNet 网 络 结构 ， 以 适应 中 国 
特有 的 花卉 种 类 和 环境 。 这 包括 对 网 络 深度 、 通 道 数 等 超 参 数 的 调整 ， 以 提高 模型 在 
本 土 花卉 数据 上 的 性 能 。 国 内 的 研究 者 还 在 探索 如 何 将 花卉 识别 技术 应 用 于 智能 农业 
领域 ， 例 如 自动 采花 系统 的 设计 和 实现 。 这 方面 的 研究 有 望 为 农业 生产 提供 更 高 效 、 
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智能 的 解决 方案 中。 

总 体 而 言 ， 基 于 ResNet 网 络 的 花卉 种 类 识别 研究 在 国内 外 都 取得 了 显著 的 进展 ， 
研究 者 们 持续 致力 于 优化 算法 、 拓 展 应 用 场景 ， 为 推动 植物 学 和 计算 机 视觉 的 交叉 研 
完 做 出 贡献 。 未 来 随 着 技术 的 不 断 创 新 ， 花 地 种 类 识别 技术 有 望 在 更 多 领域 展现 其 实 
用 性 和 智能 化 水 平 。 

1.3 研究 内 容 和 结构 


本 研究 的 结构 主要 分 为 以 下 几 个 部 分 : 

一 、 花 开 数 据 集 的 构建 : 本 研究 首先 致力 于 构建 一 个 包含 多 个 花 开 种 类 的 数据 集 ， 
确保 数据 集 的 多 样 性 和 代表 性 。 通 过 采集 来 自 不 同 地 理 位 置 、 气 候 条 件 和 季节 的 花卉 
图 像 ， 以 及 考虑 不 同 拍摄 角度 和 光照 条 件 ， 确 保 模型 能 够 在 真实 世界 的 多 样 性 中 进行 
训练 。 

二 、ResNet 网 络 的 深入 研究 : 在 理论 层面 ， 研 究 将 对 ResNet 网 络 的 结构 进行 深 
入 分 析 。 探 讨 其 残 差 学 习 机 制 ， 理 解 在 深度 网 络 中 如 何 有 效 地 传播 梯度 ， 解 决 梯度 消 
失 和 梯度 爆炸 问题 。 通 过 对 ResNet 不 同 深度 和 复杂 度 的 变种 进行 比较 ， 选 择 最 适合 
花 开 种 类 识别 任务 的 网 络 结构 。 

三 、 模 型 训练 与 优化 : 使 用 构建 的 花卉 数据 集 ， 对 选 定 的 ResNet 网 络 进行 训练 。 
通过 使 用 深度 学 习 PyTorch 框架 以 及 GPU 加 速 ， 提 高 训练 效率 。 在 训练 过 程 中 ， 采 用 
常见 的 数据 增强 技术 ， 如 旋转 、 纵 放 和 翻转 ， 以 增加 模型 的 泛 化 能 力 。 优 化 过 程 中 ， 
调整 学 习 率 、 使 用 合适 的 正则 化 方法 ， 并 考虑 迁移 学 习 ， 从 预 训练 的 模型 中 初始 化 参 
数 ， 以 提高 模型 收敛 速度 。 

四 、 实 验 结果 与 分 析 : 对 训练 好 的 模型 进行 系统 的 实验 评估 。 通 过 与 传统 方法 以 
及 其 他 深度 学 习 架 构 进 行 比较 ， 分 析 ResNet 网 络 在 花卉 种 类 识别 上 的 性 能 表现 。 通 
过 混淆 和 矩阵、 准确 率 、 召 回 率 等 指标 ， 全 面 评估 模型 在 不 同 花 弄 类别 上 的 识别 效果 。 
同时 ， 对 模型 的 鲁 棒 性 和 泛 化 能 力 进 行 测试 ， 验 证 其 在 不 同 场景 和 条 件 下 的 适用 性 。 

五 、 创 新 点 的 验证 : 验证 研究 中 提出 的 创新 点 ， 包 括 深 度 学 习 技术 的 应 用 、 多 样 
性 数据 集 的 构建 和 模型 优化 策略 。 通 过 对 比 实验 结果 ， 证 明 ResNet 网 络 在 花卉 种 类 
识别 任务 上 相 较 于 传统 方法 和 其 他 深度 学 习 网 络 的 优越 性 ， 并 进一步 解释 其 优越 性 的 
原因 。 

六 、 结 果 讨 论 与 未 来 展望 : 在 实验 结果 和 分 析 的 基础 上 ， 深 入 讨论 研究 的 发 现 ， 
间 出 模型 的 局 限 性 和 改进 空间 。 同 时 ， 对 未 来 研究 方向 提出 建议 ， 如 探索 更 先进 的 深 
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度 学 习 架 构 、 进 一 步 改 进 数据 集 的 多 样 性 ， 以 及 将 模型 应 用 于 实际 场景 中 的 挑战 和 机 
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第 2 章 相关 理论 及 方法 介绍 


本 章 主要 对 一 些 卷 积 神经 网 络 模型 进行 介绍 并 对 迁移 学 习 等 在 研究 中 使 用 到 的 
方法 进行 详细 描述 。 
2.1 卷 积 神经 网 络 


卷 积 神经 网 络 CNN) 是 一 类 专门 设计 用 于 处 理 具有 网 格 结构 数据 的 深度 学 习 模 
型 ， 尤 其 在 计算 机 视觉 领域 中 取得 了 显著 的 成 功 。CNN 的 设计 灵感 主要 来 自 于 生物 
学 中 对 动物 视觉 系统 的 理解 ， 其 中 感受 野 和 权 值 共享 等 概念 在 CNN 中 得 到 了 应 用 中 ]。 

以 下 是 CNN 的 一 些 关 键 概念 和 组 成 部 分 : 

输入 层 是 卷 积 神经 网 络 各 层 中 的 底层 ， 其 功能 是 处 理 输入 数据 ， 如 去 除 平均 值 ， 
减少 数据 中 的 过 度 偏差 ， 并 改善 训练 效果 。 

卷 积 层 (Convolutional Layer): CNN 的 核心 是 卷 积 层 ， 通 过 卷 积 操作 可 以 有 效 
地 提取 输入 数据 的 局 部 特征 。 卷 积 操作 使 用 一 个 称 为 卷 积 核 〈 或 过 滤器 ) 的 小 矩阵 ， 
对 输入 数据 进行 逐 元 素 相 乘 并 求 和 的 操作 。 通 过 在 整个 输入 上 滑动 卷 积 核 ， 可 以 得 到 
输出 特征 图 。 卷 积 操 作 具 有 参数 共享 的 特性 ， 使 得 网 络 可 以 学 习 到 局 部 特征 的 通用 表 
示 。 其 原理 如 下 图 所 示 。 
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2.1 卷 积 原理 图 

池 化 层 (Pooling Layer): 池 化 层 用 于 降低 卷 积 层 输出 的 空间 维度 ,减少 计算 量 和 

参数 数量 ， 同 时 保留 重要 的 特征 。 最 大 池 化 是 常见 的 池 化 操作 ， 它 在 每 个 区 域内 选择 

最 大 的 值 作为 输出 ， 从 而 保留 区 域内 最 显著 的 特征 。 平 均 池 化 是 另 一 种 常见 的 池 化 操 
作 ， 采 用 区 域内 数值 的 平均 值 作为 输出 。 最 大 池 化 原理 如 下 图 所 示 。 
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图 2. 2 最 大 池 化 原理 图 
激活 函数 (Activation Function): 在 卷 积 神经 网 络 中 ， 通 常 在 卷 积 层 和 全 连接 层 
后 添加 激活 函数 ， 以 引入 非 线 性 变换 。 常 用 的 激活 函数 包括 ReLU (Rectified Linear 
Unit)、Sigmoid 和 Tanh。ReLU 是 最 常用 的 激活 函数 ， 它 将 负 值 置 零 ， 保 留 正 值 ， 有 
助 于 网 络 学 习 更 复杂 的 表示 。 其 函数 图 如 下 图 所 示 。 


图 2.3 ReLU 函数 图 
全 连接 层 (Fully Connected Layer): 全 连接 层 通 常 接 在 卷 积 层 和 池 化 层 之 后 ， 用 
于 整合 高 级 抽象 特征 并 生成 最 终 输 出 。 全 连接 层 中 的 每 个 神经 元 与 前 一 层 的 所 有 神经 
元 相连 接 ， 形 成 全 连接 的 权重 矩阵 。 
CNN 的 设计 使 得 它 在 图 像 识别 、 目 标 检测 、 语 音 处 理 等 领域 取得 了 广泛 的 成 功 ， 
成 为 深度 学 习 中 的 重要 工具 。 其 结构 图 如 下 图 所 示 。 
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整体 架构 : 


L 输 入 层 特征 图 特征 图 特征 图 特征 


征 图 
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图 2.4 CNN 网 络 结构 图 


= | 


2.2 ResNet 网 络 


ResNet (Residual Network) 是 由 Microsoft Research 提出 的 一 种 深度 学 习 网 络 结 
构 ， 于 2015 年 在 ILSVRC (ImageNet Large Scale Visual Recognition Challenge) 比赛 
中 取得 了 优胜 。 其 主要 贡献 在 于 引入 了 残 差 学 习 的 概念 , 通过 残 差 块 (Residual Block) 
的 设计 ， 使 得 网 络 可 以 更 轻松 地 训练 和 优化 超 深 的 层次 ， 解 决 了 传统 深度 神经 网 络 中 
的 梯度 消失 和 梯度 爆炸 等 问题 欠 。 

以 下 是 ResNet 网 络 的 主要 特点 和 组 成 部 分 : 

FRAZER (Residual Block): ResNet 网 络 的 核心 是 残 差 块 ， 它 包含 了 一 个 跳跃 连接 
(shortcut connection) 和 两 个 普通 的 卷 积 层 。 跳 跃 连接 允许 输入 直接 绕 过 一 个 或 多 个 
层 ， 将 未 经 变换 的 输入 加 到 输出 上 ， 这 种 结构 允许 网 络 学 习 到 残 差 〈 或 误差 )， 从 而 
更 容易 地 训练 深层 网 络 。 

层次 结构 (Layer Stacking): ResNet 通过 堆 针 多 个 残 差 块 来 形成 深层 网 络 。 这 种 
层次 结构 使 得 网 络 可 以 根据 任务 的 复杂 性 选择 合适 的 深度 ， 而 不 会 受到 梯度 消失 的 影 
响 。ResNet 的 深度 通常 从 几 十 层 到 数 百 层 不 等 ， 相 比 于 传统 的 深度 网 络 ， 具 有 更 强 的 
表达 能 

全 局 平均 池 化 (Global Average Pooling): ResNet 中 不 使 用 传统 的 全 连接 层 ， 而 是 
采用 全 局 平均 池 化 层 。 这 一 层 将 每 个 特征 图 的 所 有 元 素 取 平均 值 ， 得 到 一 个 固定 大 小 
的 输出 ， 用 于 连接 到 最 终 的 分 类 层 。 这 样 的 设计 减少 了 参数 数量 ， 有 助 于 降低 过 拟 合 
的 风险 。 

超 深 的 网 络 结构 : ResNet 引入 的 残 差 学 习 机 制 使 得 网 络 可 以 轻松 地 超越 百 层 ， 甚 
至 千 层 。 这 种 超 深 的 网 络 结构 有 助 于 提取 更 高 层次 、 更 抽象 的 特征 ， 从 而 提高 模型 的 
表达 能 

预 训练 与 迁移 学 习 : ResNet 网 络 通常 通过 在 大 规模 图 像 数 据 集 上 进行 预 训练 ， 例 
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如 ImageNet 数据 集 ， 以 学 习 通 用 的 特征 表示 。 在 训练 目标 任务 时 ， 可 以 采用 迁移 学 
习 的 方式 ， 将 预 训练 的 ResNet 网 络 的 权重 作为 初始 值 ， 有 助 于 提高 模型 的 收敛 速度 


和 性 能 。 


ResNet 的 提出 极 大 地 推动 了 深度 学 习 领 域 的 发 展 , 成 为 解决 深度 神经 网 络 难以 训 
练 的 问题 的 重要 里 程 碑 之 一 。 它 的 成 功 启发 了 许多 后 续 深度 学 习 网 络 的 设计 ， 并 在 计 


算 机 视觉 领域 取得 了 许多 重要 的 成 果 。 


34-layer residual 


image 
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3x3 conv, 64 
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3x3 conv, 128 


3x3 conv, 128, /2 
3x3 conv, 128 
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图 2.4 34 层 
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3x3 conv, 128 
3x3 conv, 256. /2 
3x3 conv, 256 
3x3 conv, 256 
3x3 conv, 256 
3x3 conv, 256 


ResNet 网 络 结构 图 


其 具体 结构 如 下 图 所 示 印 。 


512, /2 
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layer name | output size 18-layer | 34-layer 50-layer 101-layer 152-layer 
conv! 112x112 7x7, 64, stride 2 
3x3 max pool, stride 2 
1x1, 64 1x1, 64 1x1, 64 
ee ， ， 
| | epee | x2 | sep Js 3x3,64 |x3 3x3,64 |x3 3x3,64 |x3 
3x3, 3x3, 
1x1, 256 1x1, 256 1x1, 256 
1x1, 128 1x1, 128 1x1, 128 
se 3 $ 3 r 
conv3x | 28x28 ete 2 Ea 3x3,128 | x4 | | 3x3,128 |x4 | | 3x3,128 | xs 
ENEA sii 1x1, 512 1x1,512 1x1,512 
1x1, 256 1x1, 256 1x1, 256 
x3, 2 2 
conv4_x 14x14 | a }2 | ssi TE | x6 3x3,256 | x6 3x3, 256 | x23 3x3, 256 | x36 
ee ci ——— 1x1, 1024 1x1, 1024 1x1, 1024 
1x1, 512 1x1, 512 1x1,512 
2 vd 
conv5x | 7x7 | rages Jx bee | x3 | | 3x3,512 | x3 | | 3x3,512 | x3 | | 3x3,512 |x3 
RNA iii 1x1, 2048 1x1, 2048 1x1, 2048 
1x1 average pool, 1000-d fc, softmax 
FLOPs 1.8x10” [| 36x10" 3.8x10° 7.6x10° 11.3x10° 


2.5 各 层 对 应 结构 表 
在 本 次 的 实验 中 使 用 的 ResNet 网 络 模型 为 152 层 的 网 络 模型 。 
2.3 其 他 网 络 模型 


本 实验 为 了 更 好 的 展示 ResNet 网 络 在 进行 识别 方面 的 优越 性 ， 使 用 了 AlexNet 
网 络 、VGG 网 络 等 模型 ， 其 中 AlexNet 网 络 和 VGG 网 络 结构 如 下 图 所 示 。 
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图 2.6 AlexNet 网 络 结构 图 

AlexNet 是 一 个 相对 较 深 的 卷 积 神经 网 络 ， 有 具有 8 个 学 习 层 (5 个 卷 积 层 和 3 个 
全 连接 层 )。AlexNet 使 用 了 较 大 尺寸 的 卷 积 核 ， 如 11x11, 5x5 和 3x3。 这 有 助 于 捕捉 
不 同 尺度 的 特征 。AlexNet 使 用 ReLU (Rectified Linear Unit) 作为 激活 函数 ， 这 有 助 
于 引入 非 线 性 ， 加 速 训练 过 程 。AlexNet 引入 了 局 部 响应 归 一 化 层 ， 这 有 助 于 增强 模 
型 的 泛 化 能 力 。 然 而 ， 在 后 续 的 研究 中 ，LRN 并 没有 被 广泛 采用 ， 而 是 被 其 他 正则 化 
技术 如 批 标准 化 (Batch Normalization) 所 取代 。 在 卷 积 层 之 后 ，AlexNet 使 用 最 大 池 
化 层 进行 下 采样 ， 以 减 小 特征 图 的 尺寸 。AlexNet 包含 三 个 全 连接 层 ， 其 中 最 后 一 个 
全 连接 层 输出 1000 个 类 别 的 概率 分 布 ， 用 于 ImageNet 的 分 类 任务 。 在 全 连接 层 中 ， 
AlexNet 采用 了 Dropout 层 ， 以 减少 过 拟 合 。AlexNet 在 训练 时 使 用 了 大 量 的 数据 增强 
技术 ， 如 翻转 、 随 机 裁剪 等 ， 以 增加 训练 数据 的 多 样 性 ， 提 高 模型 的 泛 化 能 

总 体 上 ，AlexNet 的 成 功 标 志 着 深度 学 习 在 计算 机 视觉 领域 的 崛起 ， 并 为 后 续 更 
深 、 更 复杂 的 神经 网 络 黄 定 了 基础 。 由 于 计算 资源 和 数据 集 的 限制 ，AlexNet 的 设计 
考虑 了 如 何 充 分 利用 GPU 进行 训练 ， 这 也 促使 了 深度 学 习 硬 件 和 软件 的 发 展 。 


图 2.7 VGG 网 络 结构 图 
VGG (Visual Geometry Group) 是 一 种 卷 积 神经 网 络 (CNN) 架构 ， 由 牛津 大 学 
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的 Visual Geometry Group 团队 提出 。 该 架构 首次 在 2014 年 的 ImageNet 大 规模 视觉 识 
别 竞 赛 (ILSVRC) 中 取得 了 显著 的 成 功 ，VGG16 和 VGG19 是 最 为 知名 的 两 个 版 本 。 
VGG 网 络 相对 较 深 ， 其 核心 思想 是 通过 使 用 小 尺寸 的 卷 积 核 和 较 深 的 网 络 来 提 
高 性 能 。VGG16 包含 16 个 卷 积 层 和 全 连接 层 ， 而 VGG19 则 包含 19 个 。VGG 网 络 
中 的 卷 积 层 均 使 用 3x3 的 卷 积 核 ， 并 采用 步 幅 为 1 和 零 填充 。 这 种 设计 有 助 于 保留 空 
间 信 息 ， 同 时 减少 参数 数量 。 在 卷 积 层 之 后 ，VGG 使 用 最 大 池 化 层 进行 下 采样 。 最 
大 池 化 用 于 减 小 特征 图 的 尺寸 ， 从 而 降低 计算 负担 和 提高 网 络 的 感受 野 。VGG 网 络 
在 卷 积 层 之 后 包含 全 连接 层 ， 用 于 整合 高 层次 的 语义 信息 。 这 些 全 连接 层 在 最 后 几 层 
的 特征 图 上 操作 , 以 生成 最 终 的 分 类 输出 。VGG 网 络 中 常 使 用 ReLU (Rectified Linear 
Unit) 作为 激活 函数 ， 以 引入 非 线 性 性 。 在 全 连接 层 中 ，VGG 网 络 使 用 了 Dropout fz, 
有 助 于 防止 过 拟 合 。 最 后 的 全 连接 层 用 于 执行 分 类 任务 ， 通 常 采 用 softmax 激活 函数 
输出 类 别 概率 。 由 于 VGG 相对 简单 而 直观 的 架构 ， 它 成 为 了 深度 学 习 入 门 和 理解 的 
良好 范例 。 
2.4 迁移 学 习 


Æ (Transfer Learning) 是 一 种 机 器 学 习 方法 ， 它 利用 在 一 个 任务 上 学 到 的 
知识 ， 来 改善 在 新 任务 上 的 学 习性 能 。 在 深度 学 习 领 域 ， 迁 移 学 习 被 广泛 应 用 ， 尤 其 
在 数据 集 较 小 、 计 算 资 源 有 限 的 情况 下 ， 能 够 有 效 提高 模型 的 泛 化 能 力量 。 

迁移 学 习 则 在 通过 将 在 一 个 相关 任务 上 学 到 的 知识 应 用 于 新 任务 ， 从 而 改善 新 任 
务 的 学 习性 能 。 渤 移 学 习 的 关键 假设 是 ， 不 同 的 任务 之 间 存 在 一 些 共享 的 知识 ， 这 些 
知识 可 以 帮助 提高 模型 在 新 任务 上 的 性 能 。 迁移 学 习 的 常见 做 法 之 一 是 使 用 在 大 规模 
数据 集 上 预 训练 的 模型 ， 如 ImageNet 上 预 训练 的 卷 积 神经 网 络 (CNN) 或 BERT 等 
自然 语言 处 理 任务 上 预 训练 的 模型 。 这 些 预 训练 模型 已 经 学 到 了 丰富 的 特征 表示 ， 可 
以 作为 通用 的 特征 提取 器 。 在 迁移 学 习 中 ， 常 常 使 用 层 的 冻结 和 人 解冻 策略 。 冻 结 一 些 
层 的 参数 意味 着 在 训练 过 程 中 保持 它们 不 变 ， 只 训练 部 分 层 的 参数 ， 通 常 是 新 添加 的 
全 连接 层 。 随 着 训练 的 进行 , 逐渐 解冻 之 前 冻结 的 层 , 使 得 整个 模型 逐渐 适应 新 任务 。 
在 迁移 学 习 中 ， 需 要 根据 目标 任务 的 性 质 来 评估 模型 性 能 。 在 微调 过 程 中 ， 可 能 需要 
进行 超 参数 的 调整 ， 例 如 学 习 率 、 训 练 批 次 大 小 等 ， 以 便 更 好 地 适应 新 任务 中。 
迁移 学 习 在 实际 应 用 中 得 到 了 广泛 的 应 用 ， 特 别 是 在 计算 机 视觉 、 自 然 语 言 处 理 
音 识 别 等 领域 。 它 不 仅 可 以 加 速 模型 的 训练 过 程 ， 同 时 也 能 够 提高 模型 对 新 任务 


让 


和 语音 识 
的 泛 化 能 力 。 
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第 3 章 数据 处 理 


本 章 对 实验 中 的 图 像 数据 库 的 构建 ， 图 像 的 预 处 理 以 及 调用 等 操作 进行 简要 介绍 ， 
并 展示 了 进行 与 处 理 后 的 图 像 。 
3.1 图 像 数据 库 建立 


本 实验 共 收 集 了 7000 余 张 图 ， 品 种 达到 100 多 种 。 在 构建 图 像 识 别 系 统 时 ， 
像 数据 收 集 一 般 不 是 在 环境 中 搜索 对 象 ， 就 是 事先 收集 对 象 实例 。 数 据 集 的 质量 很 大 
程度 上 取决 于 收集 和 注释 的 性 能 。 实 验 中 使 用 的 数据 集 分 为 训练 集 (train) 和 验证 集 
(valid) 两 部 分 ， 这 两 种 数据 集 共同 存放 于 “flower_data” 文 件 夹 下 ， 训 练 集 和 验证 集 
每 个 文件 下 都 包含 一 定数 量 的 子 文 件 来， 并 且 这 些 子 文件 夹 按照 顺序 进行 命名 ， 每 个 
子 文件 夹 下 存放 有 同一 品种 的 花卉 图 片 若干 张 。 

在 建立 完 训练 和 验证 所 需要 的 数据 集 后 需要 建立 一 个 name 文本 ， 格 式 为 json X 
件 ， 文 本 内 容 以 字典 的 形式 进行 存储 ， 分 别 对 应 子 文 件 夹 下 的 每 种 花卉 的 名 字 。 建 立 
该 文件 的 目的 是 在 进行 输出 是 对 应 花 开 的 名 称 以 便于 观察 是 否 准 确 。 有 基体 如 下 图 所 示 。 


~ 个 是》 此 电脑 新 加 卷 (D:) > Python > jupyter > 卷 积 网 络 实战 》 flower data > vO &fk 
名 称 修改 日 期 类 型 大 小 

访问 
train 23/12/31 10:51 文件 赤 

Drive - Persona = valid 23/12/31 10:51 文件 夹 

+ 

当 


iyaka > Sitot (D) > Python > jupyter > HRINERA > flower data > train 


图 3. 1 数据 集 文件 
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ff cat to namejson - 记 吉本 


TER SE #0 SEV SH 

121": firey, 3": “Canterbury bel’, "48": "bolero deep blue,“ "pink prinose", "34". mexican aster", "27° ‘prince of wales fat 
en gg ee Wa e Wa 
‘8: ‘cyclamen’, "94 foxglove’, "3: angipan’ "74"; “rose, ‘89: "watercress", "73": "water ly’, "40: walffower, 77° “passion 


图 3. 2 文件 夹 对 应 花 开 名 称 


3.2 数据 的 预 处 理 


由 于 本 次 所 用 于 训练 的 数据 集 并 不 多 ， 为 了 使 训练 达到 最 大 化 ， 需 要 对 数据 进行 
预 处 理 操 作 。 数据 的 预 处 理 主 要 有 中 心 裁 前 ,图 像 翻 转 等 ， 目 的 是 使 数据 具有 多 样 性 ， 
以 保证 训练 效果 。 同 时 数据 的 预 处 理 可 以 减少 训练 神经 网 络 的 计算 时 间 ， 提 高 读 取 数 
据 的 效率 。 在 本 次 的 实验 中 ， 对 数据 进行 预 处 理 、 数 据 的 增强 以 及 预 处 理 等 操作 主要 
是 通过 TorchVision 中 的 Transform 模块 进行 实现 的 。 在 本 次 的 实验 中 ， 图像 预 处 理 采 
用 -45 到 45 度 之 间 随 机 旋转 ， 长 度 为 224 的 中 心 裁剪 ， 并 且 选 择 概率 为 0.5 进行 随机 
水 平 翻转 、 垂 直 翻 转 以 及 概率 为 0.025 转化 成 灰 度 率 , 在 训练 时 使 用 的 batch_size 为 8。 


具体 数据 处 理 结构 图 下 图 所 示 。 


image datasets 


{'train': Dataset ImageFolder 
Number of datapoints: 6553 
Root location: ./flower_data/train 
StandardTransform 
Transform: Compose( 
RandomRotation(degrees=[-45.0, 45.0], interpolation=nearest, expand=False, fill=0) 
CenterCrop(size=(224, 224)) 
RandomHorizontalFlip(p=0.5) 
RandomVerticalFlip(p=0.5) 


Colorjitter(brightness=(@.8, 1.2), contrast=(0.9, 1.1), saturation=(0.9, 1.1), hue=(-0.1, @.1)) 


RandomGrayscale(p=0.025) 
ToTensor() 
Normalize(mean=[@.485, 0.456, 0.406], std=[0.229, 0.224, @.225]) 
)， 
‘valid’: Dataset ImageFolder 
Number of datapoints: 818 
Root location: ./flower_data/valid 
StandardTransform 
Transform: Compose( 
Resize(size=256, interpolation=bilinear, max_size=None, antialias=warn) 
CenterCrop(size=(224, 224)) 
ToTensor( ) 
Normalize(mean=[@.485, 0.456, 0.406], std=[0.229, 0.224, @.225]) 
)} 


图 3.3 训练 集 和 验证 集 处 理 


3.3 数据 展示 


在 进行 数据 预 处 理 完 操作 后 ， 可 以 观察 到 处 理 后 的 图 像 如 下 。 
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3.4 处 理 后 图 像 展示 
通过 观察 可 以 看 出 ， 在 经 过 预 处 理 之 后 图 像 全 部 变 成 了 大 小 相同 的 格式 ， 且 人 花 开 
与 name 文件 中 的 花 开 名 称 相对 应 。 
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第 4 章 网 络 搭建 及 模型 训练 


本 文 主要 介绍 神经 网 络 模型 的 选取 搭建 以 及 对 模型 的 训练 。 
4.1 网 络 模型 选取 及 搭建 


本 研究 中 所 有 的 模型 均 是 以 PyTorch 框架 进行 构建 的 ， 主 要 3 种 网 络 模 型 ， 具 体 
的 模型 选择 可 以 通过 对 “model_name” 的 定义 进行 实现 ， 如 下 图 所 示 。 


: |model_name = ‘resnet’ #7 i8H/H# ['resnet', ‘alexnet', ‘vgg 
HE BA EWEN RER i 


feature_extract = True 


图 4. 1 网 络 模型 选择 
在 神经 网 络 模型 训练 过 程 中 ， 相 比 于 CPU 而 言 ，GPU 可 以 极 大 提升 训练 效率 ， 

因此 在 进行 模型 搭建 前 需要 判断 设备 是 否 具备 GPU 运算 能 力 。 在 开始 时 会 加 载 models 
中 提供 的 模型 ， 并 且 直 接 用 训练 的 好 权重 当做 初始 化 参数 。 在 以 上 过 程 完 成 之 后 就 可 
以 进行 网 络 模型 hed 由 于 ResNet 网 络 、AlexNet 网 络 以 及 VGG 网 络 模型 均 有 训 
练 好 的 ， 所 以 只 需 通 过 迁移 学 习 将 其 下 载 下 来 并 按照 实验 需要 进行 修改 即 可 。 以 
ResNet 网 络 模型 为 例子 ， 这 里 对 其 需要 进行 训练 的 层 进行 了 修改 ， 连 接 层 修改 为 了 
102。 

4.2 参数 设置 


4.2.1 输出 层 与 梯度 设置 

为 了 防止 每 一 层 计算 过 后 梯度 会 进行 更 新 , 这 里 将 每 一 层 的 “param.requires_grad” 
参数 设置 为 False， 这 样 在 进行 反 向 传播 的 时 候 会 停止 计算 梯度 ， 使 其 保持 不 变 。 当 
将 “param.requires_grad” 的 参数 值 改 为 False 时 ,运行 可 以 发 现 不 再 显示 每 层 的 参数 ， 
表示 不 再 进行 更 新 。 
4.2.2 优化 器 与 学 习 率 衰减 

在 本 次 实验 中 ， 网 络 模型 使 用 的 优化 器 为 Adam 优化 器 ， 学 习 率 经 过 查阅 资料 以 
及 多 次 试验 设置 为 0.001， 学 习 的 衰减 率 为 0.1， 有 具体 方式 如 下 图 所 示 。 
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ALERE 

optimizer_ft = optim.Adam(params to update, lr=1e-2) 

scheduler = optim.lr_scheduler.StepLR(optimizer_ft, step_size=7, ganmaz0.1)#¢J#87/\epochR MMR HH1/10 
#@ A-F C#LogSoftmax() J, HLA fenn. CrossEntropyLoss() it # J, nn. CrossEntropyloss() 4 4 F LogSoftmax( ) #nn.\ 
criterion = nn.NLLLoss() 


MI Dobe 1 上 


图 4.2 优化 器 及 衰减 率 设 置 
4.3 模型 训练 


在 每 个 训练 周期 中 ， 设 置 “running loss” P “running corrects” WHA, Za 
进行 训练 集 和 测试 集 的 加 载 , 在 每 个 周期 中 , 只 有 在 训练 的 时 候 才 会 计算 和 更 新 梯度 。 
之 后 会 计算 损失 并 得 到 最 好 的 那 次 模型 ， 训 练 完 成 之 后 将 最 好 的 一 次 当做 模型 训练 的 
结 


4.4 结果 展示 


在 本 次 实验 中 ， 由 于 所 用 设备 落后 以 及 数据 资料 等 方面 的 原因 ， 经 过 多 次 验证 选 
择 训练 周期 为 44， 经 过 不 同 模型 训练 后 ， 使 用 一 个 batch 中 的 数据 进行 花 开 识别 效果 
如 下 图 所 示 。 


tree poppy (tree poppy) gazania (ball moss} 


pelargonium (pelargonium) 


colt's foot {colt's foot) 


californian poppy (californian poppy) wild pansy (wild pansy) 


4.3 ResNet 网 络 训练 结果 预测 
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passion flower (passion flower) 


love in the mist (love in the mist) desert-rose (desert-rose) 


cyclamen (watercress) 


sword lily (sword lily) morning glory (morning glory) wild pansy (wild pansy) prince of wales feathers (lenten rose) 
_—— 


> 


4.4 VGG 网 络 训练 结果 测试 


hibiscus (hibiscus} purple conefiower (stemless gentian} 


english marigold (english marigold) g silverbush (black-eyed susan) 


4 


` 


sunflower (bishop of llandaff} siam tulip {siam tulip) hibiscus (hibiscus) 


图 4.5 AlexNet 网 络 训练 结果 测试 
其 不 同 模型 经 过 相同 的 训练 周期 后 最 终 识别 的 准确 率 如 下 图 所 示 。 


colt's foot (colt's foot) 
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train Loss: 3.4059 Acc: 0.8086 
valid Loss: 8.7821 Acc: 8.6528 
Optimizer learning rate : 8.8010000 


4.6 AlexNet 网 络 


train Loss: 2.9266 Acc: 日 .7981 
valid Loss: 9.3593 Acc: 0.6455 
Optimizer learning rate : 60.0010000 


图 4.7 VGG 网 络 
train Loss: 2.6867 Acc: 6.8265 
valid Loss: 8.20/74 Acc: 0.6932 
Optimizer learning rate : 80.0010000 


4.8 ResNet 网 络 


不 同 模型 下 得 到 的 准确 度 如 下 表 所 示 。 
表 4.1 模型 训练 测试 准确 度 


83% 74% 
80% 65% 
80% 64% 


通过 训练 后 测试 集 最 终 的 准确 率 可 以 看 出 ， 相 比 于 其 他 的 神经 网 络 ，ResNet 网 络 
模型 的 准确 率 更 高 ， 更 适合 用 于 处 理 花 开 识别 。 

由 于 数据 集 以 及 设备 原因 导致 训练 周期 有 限 ， 所 以 各 模型 的 识别 准确 率 并 未 达到 
最 大 ,但 通过 每 一 周期 训练 得 到 的 数据 趋势 来 看 ， ResNet 网 络 模型 是 目前 比较 适合 进 
行 花 开 识别 训练 的 模型 。 


结 it 


通过 观察 实验 得 出 的 数据 可 以 看 出 ， 基 于 ResNet 网 络 的 花卉 种 类 识别 研究 相 比 
于 其 他 网 络 结构 主要 有 以 下 几 个 优势 。 

提高 了 识别 准确 性 : 实验 结果 表明 通过 使 用 ResNet 网 络 在 花 开 种 类 识别 任务 上 
取得 了 更 高 的 识别 准确 性 , ResNet 网 络 的 深度 和 残 差 学 习 机 制 使 其 在 学 习 复 杂 的 花 开 
特征 时 更 为 有 效 ， 相 较 于 传统 方法 或 其 他 深度 学 习 网 络 ， 表 现 更 为 优越 。 

网 络 深度 对 性 能 的 影响 : 通过 对 ResNet 网 络 的 深度 进行 实验 ， 可 能 得 出 结论 指 
出 ， 在 一 定 范 围 内 增加 网 络 深 度 有 助 于 提高 花 开 种 类 识别 的 性 能 。 然 而 ， 过 深 的 网 络 

能 导致 过 拟 合 或 训练 困难 ， 因 此 需要 在 深度 和 性 能 之 间 找 到 合适 的 平衡 点 。 

迁移 学 习 的 有 效 性 : 如 果 在 研究 中 采用 了 迁移 学 习 策 略 ， 结 论 可 能 会 强调 其 在 人 花 
人 
用 的 特征 表示 ， 为 花 齐 识别 任务 提供 了 有 力 的 先 验 知识 ， 从 而 加 速 模型 的 收敛 并 提高 
泛 化 性 能 
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